草庐IT

MySQL VARCHAR 长度和 UTF-8

全部标签

xml - 如何强制将 XML 编码为 UTF-8?

我正在尝试通过以下方式在我正在构建的xml中强制执行编码:XmlWriterSettingsxmlSetting=newXmlWriterSettings();XmlWriterxmlWriter;Strres;xmlSetting.encoding('UTF-8');xmlWriter=XmlWriter::newXml(xmlSetting);xmlWriter.writeStartDocument();xmlWriter.writeStartElement('root');xmlWriter.writeEndElement();xmlWriter.writeEndDocument

xml - 使用 MSXML 以 UTF-8 格式保存 XML

我正在尝试加载一个简单的Xml文件(以UTF-8编码):并在vbscript中用MSXML保存:SetxmlDoc=CreateObject("MSXML2.DOMDocument.6.0")xmlDoc.Load("C:\test.xml")xmlDoc.Save"C:\test.xml"问题是,MSXML以ANSI而不是UTF-8保存文件(尽管原始文件是以UTF-8编码的)。MSDNdocsforMSXML表示save()将以XML中定义的任何编码写入文件:CharacterencodingisbasedontheencodingattributeintheXMLdeclarati

XML UTF-8 数据的写入方式不同

不幸的是,我在一个名为uniPaaS的鲜为人知的平台上工作,所以我可能正在寻求一些与平台无关的建议。我收到一个Web服务请求,其中XML文档包含那些令人讨厌的智能引号。该字符的字节数据是E28099(这是一个00002019RIGHTSINGLEQUOTATIONMARK)当我将XML文件写入暂存服务器上的磁盘时,它写入正确。当我在我们的生产服务器上编写它时,它完全改变了那些字节的值并使XML文档格式错误:E28099变为92。有没有人见过这种行为?似乎只有一个字节的字符串(但SOAP响应有50Mb大,所以我还没有机会区分整个文件)。 最佳答案

java - 处理 UTF-8 编码

我们有一个在Weblogic服务器上运行的Java应用程序,它从JMS或MQ队列中获取XML消息并将其写入另一个JMS队列。应用程序不会以任何方式修改XML内容。我们使用BEA的XMLObject来读取消息并将消息写入队列。XML消息包含UTF-8编码类型声明。当XML包含超出正常ASCII范围的字符(例如£符号)时,我们会遇到问题。当从队列中读取消息时,我们可以看到£符号是完整的,但是一旦我们将其写入目标队列,£符号就会丢失并被£代替。我检查了操作系统级别设置(区域设置),一切似乎都很好。我还应该检查什么以确保不会发生这种情况? 最佳答案

java - 正式或实用的 XML 标签长度限制?

我没能在网络上找到任何关于xml标签长度限制的提及。我希望构建XML架构,作为第3方向我们发送数据的规范。模式(和数据)应该符合我们的自定义本体/数据字典,这是分层的和用户可定制的。自然映射适用于层次结构中的节点,用于命名XSD/XML中的类型和标签。然而,因为本体中的叶节点名称不必是唯一的,所以我正在考虑将层次结构中节点的完整路径编码为标记名称,并根据XML词法规则进行适当的修改。因此,如果我的本体有多个“lisa”节点,表示不同的事物,因为它们位于层次结构中的不同位置,我可以使用节点的完整路径来生成不同的XML类型/标签名称,这样您就可以拥有simpsonslisa......ap

xml - XSLT - 如果属性值字符长度大于 10,则为 bool 值 true

我试图用这个来计算我的title属性值的总字符数,但它似乎没有按照我的预期进行评估:10">double-line我还尝试将/text()附加到@title。看来我还是不干了。有什么建议吗? 最佳答案 你想要字符串长度函数: 关于xml-XSLT-如果属性值字符长度大于10,则为bool值true,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/1189422/

php - 从 PHP 以 UTF-8 编码

我不太擅长编码,但我什至对这里的基础知识都感到失望。我正在尝试创建一个被识别为UTF-8的文件header("Content-Type:text/plain;charset=utf-8");header("Content-disposition:attachment;filename=test.txt");echo"test";exit();也试过header("Content-Type:text/plain;charset=utf-8");header("Content-disposition:attachment;filename=test.txt");echoutf8_encod

xml - Node.js HTTP 客户端中的自动 UTF-8 编码

我正在尝试使用Node.js从远程主机加载XML内容。问题是像“ä”这样的德语“umlaute”被破坏了。就像在浏览器中一样,这通常是一个简单的编码问题。但是由于远程主机上的XML内容是用iso-8859-2编码的,所以我没有成功地让这些字母恢复工作。功能非常简单。我只是使用集成在Node.js中的默认HTTP客户端通过简单的get请求连接到远程主机。一些环境事实:远程系统使用“iso-8859-2”编码。编码当前设置在响应头中。response.onData(chunk)接收到的数据(chunk)中的字符不可恢复损坏Node.js在默认的Debian服务器上运行在版本0.2上。代码基

xml - Lua、XML、UTF-8

数据库从lua表中选择后,我使用luaxml库生成xml文件。一切都很好,但我在我的数据库(NySQL)中使用俄语符号。我需要用luaxml做什么来表示这个符号,而不是用代码(a-laÐ),而是用真实的符号。我找到了方法函数xml.registerCode(decoded,encoded)但什么都不懂:(或者,也许,我需要使用另一个库。如果是这样-什么库? 最佳答案 我查看了lib内部-它对所有>127字节进行强制编码,从而将UTF分解为单独的字符。它在使用其内置的.registerCode机制后执行此操作,因此您甚至无法覆盖它。如

php - 如何从 xml 文件中跳过/删除无效的非 utf8 字符

我正在寻找一种从xml文件中删除/跳过非utf8字符的方法。我正在使用simplexml_load_string(),但是当文件具有非utf8字符时,我收到错误“解析器错误:CharRef:无效的十六进制值”,代码看起来像这样:Q7fzÕ6,¯å1òw~Ò`H-7%¨§ÃU³^Ôàƒ³‡Îá_s…“w²žrâºæºçYF#K‰àa¥²o8Îk쎻qíNž‚ËÂUeJvgXêõ»'[Hw®Èl[-®Ps§æŠ§£gáRÓ„Å2Ì$ŽŽŠŽÆÁœ˜.E~Ѱ@=而且我无法保存来自该xml的信息,我正在尝试来自web/stackoverflow的许多解决方案,但没有人帮助